首页> 外文OA文献 >Glyph-aware Embedding of Chinese Characters
【2h】

Glyph-aware Embedding of Chinese Characters

机译:汉字的字形嵌入

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

Given the advantage and recent success of English character-level andsubword-unit models in several NLP tasks, we consider the equivalent modelingproblem for Chinese. Chinese script is logographic and many Chinese logogramsare composed of common substructures that provide semantic, phonetic andsyntactic hints. In this work, we propose to explicitly incorporate the visualappearance of a character's glyph in its representation, resulting in a novelglyph-aware embedding of Chinese characters. Being inspired by the success ofconvolutional neural networks in computer vision, we use them to incorporatethe spatio-structural patterns of Chinese glyphs as rendered in raw pixels. Inthe context of two basic Chinese NLP tasks of language modeling and wordsegmentation, the model learns to represent each character's task-relevantsemantic and syntactic information in the character-level embedding.
机译:鉴于英语字符级和子词单元模型在多个NLP任务中的优势和最近的成功,我们考虑了中文的等效建模问题。中文文字是逻辑文字,许多中文文字由常见的子结构组成,这些子结构提供了语义,语音和句法提示。在这项工作中,我们建议将字符字形的视觉外观明确地并入其表示中,从而实现汉字的新型字形感知嵌入。受卷积神经网络在计算机视觉中成功的启发,我们使用它们来合并以原始像素渲染的中国字形的时空结构模式。在两个基本的中文NLP语言建模和分词任务中,该模型学会了在字符级嵌入中表示每个字符的任务相关语义和句法信息。

著录项

  • 作者

    Dai, Falcon Z.; Cai, Zheng;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号